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(57) Abstract 

A method comprising an image decomposition step using multiresolution pyramidal Gabor transformation. The trans- 
formed image data arranged in a pyramid of sub-bands are then selected in three groups according to the spatial frequency level 
of the sub-band data, wherein the sub-band data of each group are coded by a respective one of three coding operations which 
are performed in parallel and each of which has a specific performance matching the properties of the data in each group. A re- 
verse transformation operation is then performed to recreate the images. The method uses movement-compensation prediction to 
reduce the time correlation between the two images without movement vector transmission to the receiver being absolutely neces- 
sary. The method further uses filters providing decomposition into sub-bands which only comprise value coefficients that are 
powers of two or the sum of or difference between two powers of two. A previous step allows the data for processing to be con- 
verted from interlaced (CCIR 601 format) to progressive modes, based on a movement-compensated interpolation. A final pro- 
gressive to interlaced mode conversion step may be provided in the decoder. 



(57) Ahrege Le procede comporte une etape de decomposition des images par transformation pyraraidale de Gabor a multi- 
resolutiozL Les donnees de I'image transform ee, organ isee en sous-bandes sous forme pyramidale, sont ensuite selectionnees en 
trois groupes seion Ilmportance de la frequence spatiaie des donnees des sous-bandes, les donnees des sous-bandes de chaque 
groupe etant respectivement codecs a 1'aide de trois operations de codage differentes executees en parallele, chacune de oes ope- 
rations ayant des perform axices sperifiques adaptees aux proprietes des donnees de chaque groupe. Une operation de transforma- 
tion inverse est ensuite executee pour reconstituer les images. Le procede utilise une prediction par compensation de mouvement 
pour reduire la correlation temporelle entre deux images, sans qu'il soit absolument necessaire de transmettre les vectcurs de 
mouvements au recepteur. II utilise des filtrcs pour effectuer la decomposition en sous-bandes ne comportant que des coefficients 
de valeurs etant des puissances de deux ou la somme ou la difference de deux puissances de deux. Une etape prealable permet la 
conversion des donnees a traiter d'entrelace (format CCIR 601) a progressif, basee sur une interpolation avec compensation de 
mouvement Une etape finale de conversion de progressif a entreiace peut etre prevue dans le decodeur. 
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Procede de compression de sequences d' images numeriques 

L' utilisation de sequences d' images devient de plus en plus 
importante dans les applications de l'imagerie moderne, 



teleconferences, les applications multi-m§dias, l'imagerie 
medicale, la robotique, l'imagerie satellite, la video inter- 
active et les divertissements. 

10 L 'influence du domaine de l'imagerie, en technologie, en 



l'art et la culture, rend cette utilisation de sequences 
d' images encore plus importante. C'est pourquoi un grand 
nombre de societes et d' organisations, nationales et interna- 
ls tionales, se sont investies dans les differents aspects de la 
science de l'imagerie. 

En ce qui concerne la television a haute definition, par 
exemple, d'importants efforts sont entrepris pour definir des 

20 nouveaux standards. Les efforts japonais dans ce domaine ne 
sont pas nouveaux. Dans les annees 1970 deja, la societe NHK 
(Nippon Hoso Kyokai) a commence ses recherches preparatoires 
avec onze fabricants de television japonais. Le resultat de 
ces efforts, MUSE (Multiple sub-nyquist sampling encoding) 

25 est un systeme haute-def inition analogique. L' introduction de 
ce systeme a deja commence sur une petite echelle au Japon. 
L' Europe a suivi le Japon avec un autre systeme analogique, 
le HD-MAC (High Definition Multiplexed Analog Components). 
La premiere mise en service de ce systeme est prevue pour 

30 1995. D'autres systemes interroediaires tels que D-MAC ou D2- 
MAC sont deja disponibles. De nombreuses societes et univer- 
sites americaines travaillent aussi pour introduire un 
systeme de television a haute definition analogique ou nume- 
rique. On peut citer entre autres le MIT-RC et le MIT-CC du 

35 Massachusetts Institute of Technology, le 3XNTSC de Zenith et 
le HDS-NA de North American Philips. 



5 telles que la television a haute definition (HDTV), les 



politique, dans la societe, dans l'economie, de meme que dans 



Parml les autres applications du codage video numerique on 
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peut citer la recommandation H261 CCITT (Comite consultatif 
international telegraphique et telephonique) de video- 
telephonie et de video-conference qui est un systeme de 
codage numerique, et aussi le systeme de codage pour video 
5 intercative (ISO/IEC JTC1/SC2/WG11) propose par le MPEG 
(Motion Picture Expert Group) . 

Un procede de compression d' images numeriques comportant une 
etape de decomposition des images par transformation en sous- 

10 bandes est decrit dans "International Conference on 

Acoustics, Speech and Signal Processing, Albuquerque, 3-6 
April, 1990, vol- 4, IEEE (New York, OS), M. Antonini et al: 
Image coding using vector quantization in the wavelet 
transform domain, pp. 2299-2300". II s'agit d'une application 

15 de la quantification vectorielle pour comprimer une structure 
de donnees mul tires olution. Le procede decrit ne permet de 
reduire les redondances qu'a l'interieur de chaque sous- 
bande, mais ne tient pas corapte de la dependance entre les 
sous-bandes. Par ailleurs, le codage vectoriel est applique a 

20 toutes les sous-bandes, quelle que soit 1' importance de la 
frequence spatiale des donnees des sous-bandes. Or, les 
caracteristiques des sous-bandes etant differentes selon 
1' importance de la frequence spatiale, le proc§de propose ne 
permet pas de tirer le meilleur parti de ces differences. 

25 D' autre part, ce procede ne fait aucune difference entre les 
f litres d' analyse et les f litres de synthese quant k leur 
complex! te, ce qui implique que le cout d'un decodeur mettant 
en oeuvre ce procede est aussi eleve que celui du codeur. 

30 Le but de la presente invention est de proposer un procede de 
compression d' images numeriques destine aux transmissions 
video-numeriques ou a la memorisation numerique sur des 
supports tels que des disques compacts ou des disques 
optiques, de fa^on k obtenir des debits de transmission 

35 moyens de l'ordre de 1 a 10 Mb/s avec vine qualite superieure 
par rapport aux systemes connus, tels que par exemple H261 
CCITT ou MPEG mentionnes plus haut, et avec une raise en 
oeuvre relativement simple. 
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A cet effet 1 'invention concerne un procede de compression de 
sequences d' images numeriques coraportant une etape de decom- 
position des images par transformation en sous-bandes, tel 
que defini a la revendication 1. Elie concerne egalement un 
5 dispositif pour la mise en oeuvre du proced6, tel que defini 
a la revendication 12, ainsi qu'un banc de filtres pour la 
mise en oeuvre du procede, tel que defini a la revendication 
13, et un banc de filtres destine a une transformation a 
multir6solution rapide pour la compression d' images numeri- 
10 ques, tel que defini a la revendication 15. 

Le procede de 1' invention permet en particulier de tenir 
compte de la redondance non seulement a l'interieur d'une 
sous-bande, ma is Egalement de la d6pendance entre les sous- 

15 bandes, ce qui conduit a une efficacite superieure a celle 
des proced^s connus. Le procede de 1'invention a 1'avantage 
d'etre tres simple pour sa mise en pratique. II utilise tres 
peu de meraoire tout en etant tr&s efficace. Par ailleurs, la 
precision des vecteurs de mouvement est uniquement limitee 

20 par la precision arithmetique des operations 61eraentaires de 
la contrainte spatio-temporelle. 

D' autre part, la structure des filtres de synthese beaucoup 
moins complexe que celle des filtres d' analyse permet de 

25 simplifier 1 'operation de decodage, ce qui est vital pour 
abaisser le cout du decodeur. Les filtres proposes peuvent 
etre mis en oeuvre efficacement en termes de composantes 
polyphases grace aux structures du type QMF (quadrature 
mirror filter) contenues dans les parties d' analyse de syn- 

30 these. La structure du banc de filtres permet une realisation 
VLSI avec une frequence d'horloge deux fois plus faible que 
celle proposee jusqu'ici, les filtres etant obtenus par 
optimisation d'une fonction de localisation a la fois dans 
1'espace image et dans l'espace frequentiel. 

35 

Comme represents aux figures 1 et 3, 1 ' organisation a multi- 
resolution des donnges est prise en compte par trois techni- 
ques de codage differentes, chacune donnant lieu & des 
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performances specifiques adaptees aux proprietes des classes 
de donnees respectives. 

Les frequences moyennes sont codees par une quantification 
5 vectorielle (VQ) a structure pyramidale. Cette derniere 

elimine la correlation spatiale lineaire et non-lineaire, de 
meme que la correlation lineaire et non-lineaire a travers 
les sous-bandes. Comme represents sur la figure 4, cette 
structure pyramidale consiste en une image a basse resolution 
10 dans un niveau de la pyramide et des images de detail dans 
les autres niveaux. La transformation pyramidale qui en 
resulte permet d'obtenir des informations a differents 
niveaux de resolution. 

15 Un balayage pseudo-aleatoire des sous-bandes de haute fre- 
quence minimise la distorsion visuelle due au debordement de 
la memoire- tampon en la repartissant sur toute la surface de 
1' image. Pseudo-aleatoire s'entend ici dans un sens analogue 
a celui de la fonction hasard (randomize) d'un ordinateur. 

20 

La sous-bande spatiale de composante continue est codee par 
une technique classique de modulation par impulsions codees. 

La forme speciale des filtres de synthese et d' analyse 
25 conduit a une mise en oeuvre efficace, tout en conservant une 
localisation maximale aussi bien dans les domaines spatial 
que de frequence spatiale. 

Ce precede peut etre utilise pour coder entre autres les 
30 formats ISO/CCIR 601 et CCITT/CIF. Pour les donnees a traiter 
qui sont dans le format CCIR 601, on proc§de prealablement 
dans le codeur a une conversion d'entrelace a progressif 
(figure 1) , puis dans le decodeur a une conversion de 
progressif a entrelace (figure 2), afin de restaurer le 
35 format initial. Ces conversions sont basees sur une interpo- 
lation avec compensation de mouvement. Elles ne sont pas 
necessaires pour les formats a balayage progressif. 
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L 'utilisation de la decomposition de Gabor a ete choisie 
d'une part du fait que les fonctions de Gabor, qui sont des 
fonctions gaussiennes modulees par des exponentielles 
complexes, ont une localisation optimal e dans le domaine 
5 conjoint spatial/frequence spatiale. D' autre part, selon des 
experiences recentes, la raajorite des profils des champs 
receptifs du systerae visuel des mammif feres peuvent etre 
model ises par ce type de fonctions. La partition du domaine 
de frequence spatiale en bandes d' octaves est motivee par des 
10 statistiques d' images naturelles et aussi par la sensibilite 
du sy steme visuel huraain. 

Le principal inconvenient des fonctions de Gabor reside en ce 
qu'elles ne forment pas une base orthogonale. Par consequent, 

15 il n'y a pas a priori une methode directe pour calculer la 

transformation, corarae on peut le faire dans un cas orthogonal 
par simples produits scalaires. On a dej& propose une methode 
pour effectuer la transformation pyramidal e de Gabor. Cette 
technique est basee sur le critere de l'ajustement par la 

20 methode des moindres carres. La solution au problfeme de la 
methode des moindres carres montre que les coefficients de 
ponderation peuvent etre extraits par simple multiplication 
entre une ma trice et un vecteur de donnees. Si 1' ensemble des 
fonctions de Gabor est choisi independamment de 1 'image, la 

25 ma trice multiplicative est constante. Les donnees reconsti- 
tutes sont obtenues par une autre multiplication entre la 
matrice des fonctions de Gabor et le vecteur des coefficients 
de ponderation. Une mise en oeuvre parall&le de la transfor- 
mation est par consequent rtalisee pour effectuer la trans- 

30 formation en temps reel. 

La chrominance est sous-echantillonnee dans le domaine de la 
transformee en eliminant les composants de plus haute s 
frequences de la pyramide (figure 4) . Ce procede ne deteriore 
35 pas la qualite visuelle des images couleurs. 

La composante continue spatiale (image k basse resolution, 
voir figure 3) est codee en utilisant la modulation par 
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impulsions codees (PCM) . Les niveaux moyens de la pyramide 
sont codes en utilisant une quantification vectorielle (VQ) 
hierarchique a structure arborescente, telle que representee 
a la figure 4. Les plus hautes frequences spatiales sont 
5 selectionnees de fa?on adaptative et quantifiees scalairement 
(SQ/RL) • L 'information de la position et 1 'amplitude des 
coefficients sont codes s6par6ment. Le pas adaptatif de la 
quantification et un codeur entropique a longueur variable 
sont controles en utilisant une strategie de contre-reaction 
10 basee sur 1' occupation de la memoire-tampon . 

De fa$on a exploiter la correlation temporelle (inter-images) 

entre les coefficients de chaque image , une technique 

d' inter-images dif f erentielle est utilisee. A 1'aide de deux 

15 images precedentes, 1' image courante est predite par une 
extrapolation compensee en mouvement, et seulement 1'erreur 
de prediction est codee et transmise. Les vecteurs de mouve- 
ment sont es times de fa?on hierarchique (appariement de blocs 
ou contrainte spatio-temporelle) . Ces memes vecteurs sont 

20 egalement utilises lors de la conversion de progressif a 
entrelace. De fa?on a eviter une accumulation d'erreurs de 
canal, une technique d'intra-image est appliquee dans un 
intervalle fixe pour mettre a jour complfetement tous les 
coefficients. Ce mecanisme est aussi redemarre apres chaque 

25 changement de scene. 

Les particularites et avantages de 1' invention ressortiront 
bien de la description qui suit, donnee a titre d'exemple, et 
qui se refere aux dessins annexes. 

30 

La figure 1 est un schema-bloc d'un dispositif de codage 
fonctionnant selon le procede de 1' invention. 

La figure 2 est un schema-bloc d'un dispositif de decodage 
35 fonctionnant selon le procede de 1* invention. 

La figure 3 illustre les trois differentes regions de donnees 
selon les trois strategies de codage. 
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La figure 4 illustre la mise en oeuvre des vecteurs de la 
quantification vectorielle. 

La figure 5 est un schema-bloc de la compensation en 
5 mouvement. 

La figure 6 montre un exemple de reponse impulsionnelle d'un 
filtre du banc de filtres d' analyse. 

10 La figure 7 montre un exemple de reponse impulsionnelle d'un 
filtre du banc de filtres de synthese. 

La figure 8 donne une representation dans le domaine 
frequentiel des filtres du banc de filtres d 'analyse . 



La figure 9 donne une representation dans le domaine 
frequentiel des filtres du banc de filtres de synthese. 

Les conversions d' entrelace a progressif et de progressif a 
20 entrelace 

Le systeme peut etre utilise pour coder les deux formats 
ISO/CCIR 601 (entrelace) et CCITT/CIF (progressif). Le format 
ISO/CCIR 601 est constitue de 288 par 720 images entrelacees 

25 a une frequence de 50 champs par secondes pour les systemes a 
625 lignes. Le format CCITT/CIF est constitue de 288 par 360 
images progressives a une frequence de 25 images par seconde. 
Lorsque 1 'image d' entree est dans un format entrelace, un 
premier bloc (figures 1) execute la conversion d'entrelace a 

30 progressif. Cette premiere conversion est basee sur une 
interpolation spatiale avec compensation de mouvement. Un 
dernier bloc au decodage (figure 2) permet de retrouver le 
format initial en effectuant une conversion de progressif a 
entrelace. Cette deuxierae conversion utilise une interpola- 

35 tion temporelle avec compensation de mouvement. 

De fa?on k pouvoir effectuer la conversion de 50 champs 
entrelaces par seconde en 25 images progressives par seconde 



15 
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et vice-versa, les etapes suivantes sont raises en oeuvre. Une 
image est generee pour chaque champ en utilisant une interpo- 
lation spatiale. Ceci conduit a 50 images par seconde. La 
sequence d' image est sous-echantillonnee dans le domaine 
5 temporel, de facon a conserver seulement 25 images par 
seconde. La transformation et le codage peuvent alors etre 
effectues. Dans le decodeur, une interpolation temporelle est 
executee. Ceci conduit a 50 images par seconde. Finalement, 
on conserve seulement les lignes paires ou impaires des 
10 images, de facon a generer 50 champs par seconde. 

La technique suivante est utilisee pour cette conversion. Les 
lignes manquantes sont obtenues en utilisant une interpola- 
tion spatio-temporelle avec compensation de mouvement entre 

15 les deux lignes voisines existant de part et d' autre de la 
ligne manquante. Ceci permet de passer d'une frequence dama- 
ges de 25 images par seconde a une frequence d' images 
de 50 images progressives par seconde. On utilise une inter- 
polation temporelle compensee en mouvement. Le mouvement 

20 entre deux images consecutives est estime par une technique 
hierarchique. Ces mimes vecteurs de mouvement sont egalement 
utilises pour la prediction par compensation de mouvement, et 
ils ne sont bien evidemment calcules qu'une fois. Ces deux 
techniques ont deja ete largement etudiees par de nombreux 

25 auteurs, par exemple dans les articles de M. Bierling, 

"Displacement estimation by hierarchical blockmatching", SPIE 
Visual Communications and Image Processing '88' vol. 1001, 
1988, pp. 942-951 et de M. Bierling et R. Thoma "Motion 
compensating field interpolation using a hierarchically 

30 structured displacement estimator", Signal Processing 11 
(1986) 387-404. 

La transformation pyramidale de Gahor 

35 La decomposition en sous-bandes et le codage par transformee 
en tant que sous-ensemble de la decomposition en sous-bandes 
sont tres populaires pour la compression des donnees, grace a 
la bonne qualite des resultats obtenus pour un taux de 
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compression donne par comparaison avec d'autres techniques. 

La transformation utilisee dans le present systeme est une 
transformation pyramidale de Gabor h multi-resolution. Au 
5 cours de ces dernieres annges, de nombreux travaux ont 
deraontre que les techniques de multiresolution sont tres 
efficaces pour 1 'analyse et le codage d'images; corarae par 
exemple S.G. Mallat, "A Theory for Multiresolution Signal 
Decomposition: The Wavelet Representation" , pami IEEE, volume 
10 11, number 7, July, pages 674-693, 1989, et Rosenfeld, A., 
"Multiresolution Image Processing and Analysis", Springer- 
Verlag, 1984, Berlin, Germany. 

Le choix des fonctions de Gabor pour la base de la transfor- 

15 mation (ou pour la reponse impulsionnelle des filtres de 
syn these) est motivee par le fait que ces fonctions ont une 
localisation optimale dans le domaine conjoint spatial/ 
frequence spatiale. En d'autres mots, les fonctions de Gabor 
sont les seules a atteindre la borne inferieure de l'incerti- 

20 tude de Heisenberg dans 1'espace des signaux. Ce principe 
affirme que le produit de l'etendue d'un signal dans le 
domaine spatial avec son 6 t endue dans le domaine frequentiel 
est toujours super ieur ou egal a une constante. Le minimum 
est atteint precisement, quand le signal est une fonction de 

25 Gabor. D'autre part, comme l'ont raontrS des experiences 
recentes, la majorite des profils de champs receptifs du 
systeme visuel des mammif§res peuvent etre modelises par ce 
type de fonctions. En outre le spectre de puissance des 
images naturelles decroit de maniere exponentielle lorsque la 

30 frequence spatiale augmente. Ceci motive le choix d' une 

decomposition en bandes d' octave du domaine frequentiel. De 
plus, des me sure s faites sur les cellules du champ receptif 
du cortex visuel des mammiferes ont montre que chacune 
d'entre elles est sensible aux frequences se trouvant dans 

35 une sous-bande dont la largeur de bande correspond a une 
octave . 



La conception des filtres d' analyse et de synthese (ou de 
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maniere equivalente les fonctions de base de la transfor- 
mation et des fonctions bi-orthogonales a celles-ci) s'effec- 
tue en utilisant la solution des moindres carres. Cette 
solution montre que les coefficients de la transformation 
5 peuvent etre extraits par un simple produit de matrice A*FA 
qui est equivalent a un filtrage et a un sous-echantillon- 
nage, ou A est la matrice des f litres d' analyse et F la 
matrice de 1' image. De maniere similaire, la transformation 
inverse est obtenue a l'aide d'un autre produit de matrice 

10 GXG X qui met en oeuvre le surechantillonnage et le filtrage 
inverse, ou G est la matrice des filtres de synthese et X la 
matrice des coefficients de la transformation, et ou 
X'AiTAa, avec Aa=As s A lorsqu'il s'agit de matrices carrees, 
tel que decrit dans 1 'article de T. Ebrahimi, T. Reed, et M. 

15 Kunt, "Sequence coding by Gabor Decomposition", Signal 

Processing V, Proceedings of Ensipco 90, Pages 769-772, 1990. 

Pour des questions pratiques, telles que la possibility 
d' implantation en vue d'une application en temps. reel, une 

20 approximation des fonctions de Gabor est utilisee pour 
generer les fonctions de base de la transformation. Les 
filtres de synthese sont concus pour ne contenir que des 
coefficients qui sont une somme ou une difference de deux 
puissances de deux au plus. Plusieurs methodes ont ete 

25 proposees pour approximer un filtre donne, par exemple par 
une methode basee sur les criteres min-max ou moindres carres 
par la programmation lineaire ou quadratique (voir 1' article 
de Y.C. Lim et S.R. Parker, "FIR Filter Design over a 
discrete powers-of-two coefficient space", IEEE transactions 

30 on ASSP Vol. 31 No. 3, 1983, Pages 583-591), et par une 
methode basee sur le recuit simule (voir 1' article de 
N. Benvenuto, M. Marches! et A. Uncini, "Results on the 
application simulated annealing algorithm for the design of 
digital filters. with powers-of-two coefficients", IEEE 

35 proceedings 1990, Pages 1301-1304). II est egalement possible 
d' approximer un filtre donne par plusieurs filtres mis en 
cascade. Cette approximation permet d'effectuer la transfor- 
mation inverse tres rapidement en utilisant seulement 
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quelques operations d' addition et de decalage. Toutes les 
operations de filtrage sont effectuees sur une architecture 
hautement parallfele ASP (Associative String Processor) . 
(Voir: Lea R.M., ASP: parallel computing technology, SPIE 
5 visual communi cation and image processing 90, vol 1360, 

Lausanne, Switzerland p. 78-91). La complexity est cependant 
d6plac6e dans les f litres d' analyse. Toutefois, il est 
possible d 'approximer egalement ces f litres par une somme ou 
une difference de puissances de deux. Apr 6s cette derniere 

10 operation, la propriete de reconstruction parfaite n'est plus 
verifiee. Neanraoins, des resultats montrent une qualite 
quasi-parfaite des images reconstruites, avec un rapport 
signal sur erreur de reconstruction depassant 46 dB. Un 
exemple de banc de filtres ayant des coefficients en puissan- 

15 ces de deux, approximant des filtres de Gabor, est donne aux 
figures 6 a 9. Sur les figures 7 et 9, les courbes en 
traitille 1 representent des filtres ideaux, les courbes en 
pointille 2 etant celles des filtres obtenus, faciles a 
implementer. 

20 

Les coefficients du filtre prototype (figure 6) du banc de 
filtres d' analyse sont les suivants: 

f (l)=f (10)=2-« 
25 f (2)-f (9)-=0 
f (3)=f (8)=-2-3 
f (4)=f (7)=-2-^ 
f (5)=f (6)=2o 

30 Les coefficients du filtre prototype (figure 7) du banc de 
filtres de synthese sont les suivants: 

g(i)=g(6)=2-* 

g(2 )=g(5)=2-3 
35 g(3)-g(4)=2o 

Pour une mise en oeuvre pratique, les coefficients de ces 
filtres sont programmes dans un chip special selon une 
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structure en poly-phase. 

Le demultiplexage est r6alis6 par un simple adressage de la 
me moire . 

5 

La quantification 

Les coefficients de 1' image transformee sont codes selon 
trois mSthodes diff6rentes dependant de la frequence spatiale 
10 a laquelle ils appartiennent. Ces classes de codage sont 
representees a la figure 3. 

a) La modulation par impulsions codees (PCM) 

15 La sous-bande spatiale de composante continue est codee 
par une technique classique de modulation par impulsions 
codees. Cette technique est relativement robuste en 
presence de bruit. 

20 b) La quantification vectorielle hierarchique (VQ) 

II est bien connu comment la quantification vectorielle 
(VQ) peut ameliorer les performances par rapport a la 
quantification scalaire (SQ) . (J.S. Lim, "Two-dimensional 

25 signal and image processing", pp. 589-611, Prentice-Hall 
ed., 1990, et R.M. Gray, "Vector Quantization", IEEE ASSP 
Mag., vol 1, pp. 4-29, April 1984). La caracteristique la 
plus importante de la quantification vectorielle est la 
fa?on d' exploiter la dependance statistique parmi les 

30 scalaires dans le bloc de quantification. En utilisant la 
quantification vectorielle, il est possible de prendre en 
consideration la dependance lineaire et non lineaire 
entre les scalaires (elements dans le bloc formant un 
vecteur de quantification) . 

35 

Differentes procedures de quantification peuvent etre 
appliquees au codage des sous-bandes generees par la 
transformation de Gabor. De fagon a prendre en considera- 
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tion la correlation evidente qui existe entre les 
differentes bandes, un codage plus efficace peut etre 
obtenu en rempla?ant la quantification scalaire par la 
quantification vectorielle. (Voir k cet §gard 1 'article de 
5 G. Gal and/ E. Lacson, G. Furland et J Menez, "Subband 

coding of images using adaptive VQ, and Entropy Coding", 
Image'com 90, pp. 106-110, Bordeaux, Nov. 1990). On 
utilise la quantification vectorielle dans la zone de 
frequences moyennes, ou la correlation est superieure et 
10 ou la quantification vectorielle est la plus efficace. 
Dans le domaine de la transfonnge les elements des 
vecteurs sont choisis conformeraent a la structure 
pyramidale decrite plus haut (figure 4) . 

Un parametre pertinent est constitue par la dimension des 
vecteurs, en ce que plus ils sont grands, meilleure est 
1' exploitation de la correlation entre coefficients. En 
accroissant la dimension du dictionnaire, on entralne un 
accroissement de la duree de la construction du diction- 
naire. Pour cette raison et pour de strictes conditions de 
realisation (traitement en temps reel, quantity de 
memoire), il est interessant d'utiliser une dimension de 
vecteurs petite k moyenne, dependant du nombre de niveaux 
dans la pyr amide quantifiee utilisant la quantification 
vectorielle. 

Les coefficients de chrominance sont aussi inclus dans les 
vecteurs, avec ceux de luminance (figure 4). D'apres des 
resultats exp€rimentaux decrits dans la recommandation 
30 "Encoding parameters for digital television for studios" 

CCIR Recommendation 601-1 XVTth Plenary Assembly Dubrovnik 
1986, Vol. XI, Part 1, pp. 319-328, il est possible de 
montrer que 1 'utilisation de coefficients de chrominance 
uniquement dans les frequences basses a moyennes ne 
35 deteriore pas notablement la qualite visuelle. Du point de 
vue de la realisation, le control e de la memoire-tampon 
est evite en adoptant une quantification vectorielle a 
recherche exhaustive/structure arborescente, en utilisant 
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un code de longueur fixe assigne a chaque Element- On a 
ainsi defini un systeme donnant une qualite requise 
minimum. Le debit binaire correspondant h la qualite ci^ 
dessus restera tou jours en-dessous de la capacite du 
5 canal, alors que le debit binaire disponible restant peut 
etre utilise pour amSliorer la qualite de 1 * information de 
la bande a haute frequence. Enfin, le dictionnaire est 
defini a priori et connu a la fois de l'dmetteur et du 
recepteur. 

10 

c) Quantification scalaire, code de longueur variable, 
controle de la memoire-tampon (SQ/RL) 

Le plus haut niveau de la pyramide est balaye en utilisant 

15 un balayage Peano-Hilbert en sous-blocs de 1' image selon 

un ordre pseudo-aleatoire. Ce balayage convertit les sous- 
bandes d' images a deux dimensions en chaine de nombre a 
une dimension. Cette chaine est ensuite quantifiee en 
utilisant une quantifi cation scalaire standard (SQ). II en 

20 resulte une chaine de nombres avec seulement un petit 
nombre de bits. Ces nombres sont ensuite compares a un 
seuil et mis a zero s'ils sont inferieurs au seuil. La 
grande majorite des coefficients seront plus petits que le 
seuil. Cette chaine est ensuite divis^e en deux chalnes, 

25 I'une etant une sequence de coefficients non nuls et 

1' autre etant une chaine binaire ou la valeur un represen- 
te la position d'un coefficient non nul et un z6ro 
represente un coefficient nul. La chaine binaire est codee 
en utilisant un codage de plage (RL) base sur le modele de 

30 Capon (voir a cet egard la these de M. Kunt, "Comparaison 
de techniques d'encodage pour la reduction de redondance 
d' images facsimile a deux niveaux n , these Nr. 183, LTS-DE, 
EPFL, 1974). Les coefficients non nuls sont codes en 
utilisant un code de Huffman. De fa?on a produire une 

35 sortie qui soit tou jours en-dessous du debit de donnSes 
maximum autorise, une contre-reaction depuis la mimoire- 
tampon est utilis^e pour definir le seuil. Si le debit de 
donnees depasse le maximum, le flux de donnSes est tronque 
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et le seuil est abaisse pour I 1 image suivante. Du fait de 
l'ordre pseudo-aleatoire des sous-blocs balayes, l'effet 
visuel de la troncature est minimise. 

5 Le multiplexage est realise par un simple adressage de la 
me moire, puis une transformation pyramidal e inverse est 
eff ectuee. 

La prediction par compensation de mouvement 

10 

Le pro cede decrit ici utilise une prediction par compensation 
de mouvement pour reduire la correlation temporelle entre les 
images. Des etudes ont montr§ que cette raethode est tres 
efficace pour reduire la redondance temporelle (voir a ce 

15 sujet les articles de A. Puri, H.M. Hang et D.L. Schilling, 
"An Efficient Block-Matching Algorithm for Motion-Compensated 
Coding", ICASSP, April 1987, pages 25.4.1-4, et de A.N. 
Netravali et J.D. Rob"bins, "Motion Compensated Television 
Coding-Part I", journal Bell Systems Technical Journal, 

20 volume 58, number 3, 1979, pages 629-668.). Les memes 

vecteurs de dgplacement obtenus sont aussi utilises pour la 
conversion de progressif k entrelace et pour le mouvement 
ralenti avec un bon rendu du mouvement. Dans ces deux cas, 
une interpolation temporelle avec compensation de mouvement 

25 est irapliquee (figure 5). La structure de nniltir€solution de 
la transformee pyramidale est exploitee pour trouver le 
mouvement dans deux images consecutives. Sur la figure 5, 
Fx(ra,n) et Fa(m,n) representent les deux images utilisees 
pour 1' estimation de mouvement, qui peuvent etre soit les 

30 deux images precedentes, soit une image precedente et 1' image 
courante, V(m,n) representant le champ de mouvement, F(m, n) 
1' image predite et F(m,n) 1' image interpolee, et ou m et n 
sont les indices des lignes et colonnes de 1' image. On 
utilise en premier lieu un al go ri thine d'apparieraent de blocs, 

35 ou de contrainte spatio-temporelle, sur le plus haut niveau 
de la pyramide avec la resolution la plus basse. Les resul- 
tats sont ensuite projetes vers le bas comme condition 
initiale dans les niveaux inferieurs et af fines chaque fois. 
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Les resultats fiaaux sont ensuite utilises pour predire 
1' image courante. L' ensemble du procede d' estimation de 
mouvement est effectue sur des images quantifies, de fa?on 
que le recepteur puisse reconstituer les images sans avoir 
5 regu les vecteurs de mouvement. Ce procfide peut ainsi etre 
utilise lorsqu'aucune information de mouvement n'est neces- 
saire pour le decodage du vecteur de mouvement. 

Comme mentionne ci-dessus, deux modes d' estimation de mouve- 
10 ment sont consideres ici. Dans le cas ou il n'y a peu de 

mouvement dans la scene, 1' estimation de mouvement est effec- 
tuee en se basant sur les deux images precedentes. Ainsi, 
comme dit plus haut, aucune information supplementaire n'est 
necessaire. Dans le cas ou il y a beaucoup de mouvement dans 
15 la scene, 1' estimation de mouvement est effectuee en se 

basant sur 1' image courante et 1' image precedente. Dans ce 
cas, une meilleure estimation est obtenue, mais une informa- 
tion supplementaire sur les vecteurs de mouvement est a 
envoyer a travers le canal. 



35 
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REVENDICATIONS 



10 



15 



20 



25 



30 



1. Proced6 de compression de sequences d' images numeri- 
ques, comportant une etape de decomposition des images par 
transformation en sous-bandes, caract§ris6 en ce que 1' opera- 
tion de decomposition est effectuee selon le schema d'une 
transformation pyramidale a raultiresolution, en ce que les 
donnees de 1' image transform^, organisee en sous-bandes sous 
forme pyramidale, sont ensuites selectionn6es en trois grou- 
pes selon 1' importance de la frequence spatiale des donnees 
des sous-bandes, les donnSes des sous-bandes de chaque groupe 
etant respectivement codees a l'aide de trois operations de 
codage differentes executees en parallfele, chacune de ces 
operations ayant des performances specifiques adaptees aux 
proprietes des donnees de chaque groupe, et en ce qu'une 
operation de transformation inverse est ensuite executee pour 
reconstituer les images. 

2. Procede selon la revendication 1, caracterise en ce 
que 1' operation de transformation inverse est de complex! te 
inferieure k celle de la transformation directe. 

3. Procede selon 1'une des revendi cations 1 ou 2, 
caracterise en ce que l'on effectue 1' operation de decomposi- 
tion a l'aide d'une transformation pyramidale de Gabor a 
multiresolution. 

4. Procede selon l'une des revendications 1 & 3, 
caracterise en ce qu'il comporte des f litres pour effectuer 
la decomposition en sous-bandes ne comportant que des coeffi- 
cients de valeurs etant des puissances de deux ou la sorame ou 
la difference de deux puissances de deux. 

5. Procede selon l'une des revendications 1 a 4, 
caracterise en ce qu'il comporte une operation de codage de 
la sous-bande spatiale de composante continue en utilisant 
une technique de modulation par impulsions codees, une 
operation de codage des sous-bandes de frequences moyennes en 
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utilisant une quantification vectorielle hierarcbique a 
structure arborescente et une operation de selection 
adaptatives des sous-bandes de plus hautes frequences et de 
quantification scalaires des sous-bandes sSlectionnees . 

6. Procede selon la revendication 5, caracterise en ce 
que 1' operation de quantification scalaire des sous-bandes de 
plus hautes frequences comprend un balayage Peano-Hilbert en 
sous-blocs de 1' image selon un ordre pseudo-aleatoire. 



7. Procede selon l'une des revendications precedentes, 
caracterise en ce qu'il utilise une prediction par 
compensation de mouvement pour reduire la correlation 
temporelle entre deux images, sans qu'il soit absolument 
15 necessaire de transmettre les vecteurs de mouvements au 
recepteur 

8- Procede selon l'une des revendications precedentes, 
caracterise en ce qu'il comporte une etape prealable de 
20 conversion des donnees a traiter qui sont dans le format CCIR 
601, cette £tape comportant une operation de conversion 
d'entrelace a progressif, basee sur une interpolation avec 
compensation de mouvement. 

25 9. procede selon l'une des revendications precedentes, 

caracterise en ce qu'il comporte une etape finale de conver- 
sion des donnees qui sont dans un format progressif au format 
CCIR 601, cette etape comportant une operation de conversion 
progressif a entrelace, basee sur une interpolation avec 

30 compensation de mouvement. 

10. Procede selon l'une des revendications 5 a 9, 
caracterise en ce que 1 ' information de la position et 

1 'amplitude des coefficients de la quantification sont codes 
35 separement. 

11. Procede selon la revendication 10, caracterise en ce 
que l'on controle le pas adaptatif de la quantification et un 
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codeur entropique a longueur variable en utilisant une 
strategie de contre-reaction basee sur 1 'occupation de la 
memoire-tampon. 

5 12. Dispositif pour la mise en oeuvre du procede selon 

l'une des revendication 1 h 11, caracterise en ce qu'il 
comporte des premiers moyens pour effectuer une decomposition 
des images en sous-bandes selon le schema d'une transforma- 
tion pyramidale k raultiresolution, des seconds moyens pour 
selectionner les donnees de 1' image transformee, organisee en 
sous-bandes sous forme pyramidale, en trois groupes selon 
1' importance de la frequence spatiale des donnees des sous- 
bandes, des troi si ernes, qua tri ernes et cinquiemes moyens 
destines au codage respectif en parallele des donnees des 
sous-bandes de chaque groupe, chacun desdits troi si ernes, 
quatriemes et cinquiemes moyens etant agences de fa;on a 
fournir des performances specifiques adaptees aux proprietes 
des donnees de chaque groupe, et des sixi ernes moyens pour 
effectuer une transformation inverse afin de reconstituer les 
images. 

13. Banc de filtres pour la mise en oeuvre du procede 
selon l'une des revendications 1 a 11, caracterise en ce 
qu'il comporte un ensemble de filtres du type a reconstruc- 
tion quasi-parfaite, chaque filtre contenant un nombre de 
coefficients en puissances de deux inferieur a vingt et en 
structure a raultiresolution. 



15 



20 



25 



14. Banc de filtres selon la revendication 13, 
caracterise en ce que le nombre desdits filtres est compris 
entre six et dix. 

15. Banc de filtres destine a une transformation a 
raultiresolution rapide pour la compression d' images numeri- 
ques, caracterise en ce qu'il comporte un ensemble de filtres 
du type a reconstruction quasi-parf aite, chaque filtre 
contenant un nombre de coefficients en puissances de deux 
inferieur a vingt et en structure a multiresolution. 
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16. Banc de f litres selon la revendi cation 15, 
caracterise en ce que le noinbre desdits filtres est corapris 
entre six et dix. 



WO 93/02526 



PCI7CH92/00148 



1/6 



I— I m Li !> 



E 
<d 
o 
u 

I 4J 
-P U 

o 

0Q (0 



*4 

I 

s 

■ 0* 



M 

a 

3 



I 



O 



I 

OS 

O 

03 



(0 
M 
-P 
C 
H 

u o 

© 4-> 
-P -W 

C 5 
M CO 



K 

CD 
tM 
4-1 
3 
CQ 



I 



OS 

o 



T 



C 



u o 

CD -P 

C S 
H CO 




4J 
C 

CD 
6 
CD 
> 
3 
O 
E 
I 

c 
o 
c 
\ 

c 
o 

E J= 
CD O 
> 4J 
3 *H 
O 5 
S co 



03 E 

C <0 

<C u 

U >i 

tr< Pi 






CD 




a> 




VI 








•H CD 








o cn 
E * 

KD £ 




O CP 
E « 

KD E 



o 

c ^ 

CD CD 



T 



E • 

*H > 

-P 3 

CO O 

W £ 



CD 




Cn 


• 


(0 


> 


»o 


3 


O 


O 


O 


B 



T3 • 

O > 

O 3 

•CD O 

a E 



E • 

•H > 

•P 3 

CO o 

W E 



i 



CO 

c 

CD - 

cu> 
e 3 
o o 

U E 



co E 
C (0 
(0 u 



o 

u. 



«P 
C 
CD 
B 
CD 
> 
3 
O 
E 
I 

o 
c 

-p 
c 

CD 

fi£ 
CD U 
> -P 
3 

O * 
35 co 



o 

VD CD 
KD 
02 M 
M «P 
U C 

a o 



WO 93/02526 PCI7CH92/00148 



2/6 



o 




/Intra 

tl 

1 




w o 

© +> 


c 5 
Hi ca 










CM 

g 



E 
« 
o 
i-l 

4J CD 

00 KD 

1 M 
«U 4^ 
-H C 
ffi <D 



f 



WO 93/02526 



PCT/CH92/00148 




FIG.5 



F 1 (m 9 n) 



F 2 (m,n) 



Apparicmcnt 
dc blocs 
hiSxaxchique 




F (m, n) 



1 



Interpolation 



F(m,n) 



WO 93/02526 



PCT/CH92/00148 




FIG.4 
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Analysis filter impulse response 
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F I G . 7 Synthesis filter impulse response 
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